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摘要 近期， 以 ChatGPT 为 代表 的 大 模型 技术 正 开 启 人 类 社会 智能 化 的 新 纪元 。 研 究 人 工 智 能 成 功 案 例 背 后 
的 技术 原理 ， 探 索 人 工 智 能 驱动 的 科学 研究 (AI for Science，AI4S) 新 范式 ， 对 促进 我 国 科技 进步 、 增 强国 
家 竞争 力 具 有 十 分 重要 的 意义 。 文 章 首先 以 数学 、 物 理学 、 生 物 党、 材料 科学 领域 为 例 ， 简 述 AI45S 的 研究 
进展 。 其 次 ， 面 向 近年 来 最 为 成 功 的 人 工 智能 范例 ， 分 析 AlphaFold 和 ChatGPT 的 基本 原理 和 关键 技术 。 最 
后 ， 在 以 上 分 析 的 基础 上 ， 从 算法 、 模 型 、 数 据 、 知 识 、 人 的 因素 等 角度 ， 总 结 大 模型 时 代 人 工 物 能 技术 发 


展 新 趋势 ， 探 讨 AI4S 研究 新 范式 。 


关键 词 ”智能 科学 ， 人 工 智能 ， 人 工 智 能 驱动 的 科学 研究 ，ChatGPT， 人 工 智 能 生成 内 容 (AIGC) ， 第 五 范 


式 ， 工业 5.0， 平 行 系统 


在 全 球 迎 来 前 所 未 有 之 大 变局 的 时 代 背 景 之 下 ， 
ChatGPT 在 2022 年 底 一 经 推出 便 掀起 新 一 轮 人 工 智 能 
( AI ) 浪潮 。 以 ChatGPT 为 代表 的 大 模型 技术 影响 空 
前 深远 ， 正 推动 AI 技术 从 特定 应 用 和 游戏 等 领域 进入 
人 们 日 常生 活 ， 成 为 切切 实 实 的 生产 力 工 具 ， 人 类 社 
会 的 智能 化 革命 已 经 拉 开 帷幕 。 

图 灵 奖 得 主 Jim Gary 认为 科学 研究 经 历 了 经 验 
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范式 、 理 论 范 式 、 计 算 范 式 、 数 据 驱 动 范式 等 4 种 范 
式 。 当 前 ， 许 多 科学 家 认为 科学 研究 正在 迎 来 新 的 范 
式 ， 即 第 五 范式 。 第 五 范式 以 虚实 交互 、 平 行 驱动 
的 AI 技术 为 核心 ， 以 智联 网 和 区 块 链 构建 基础 ， 考 虑 
人 的 价值 和 知识 的 融入 。 在 产业 方面 ， 第 五 范式 也 称 
为 工业 5.0"。 而 AI 驱动 的 科学 研究 ( AI for Science， 
AI4S ) ， 更 是 新 范式 在 基础 科研 的 深度 体现 。 


@ “工业 5.0” 的 概念 由 本 文 作者 王 飞 跃 于 2014 年 首先 提出 ， 并 由 德国 学 术 界 和 工业 界 呼应 已 形成 国际 共识 . 王 飞 跃 . 工业 4.0: 
皇后 的 新 衣 ? (2014-11-24). https://news.sciencenet.cn/sbhtmlnews/2014/11/294317.shtm. 
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近期 ， 科 学 技术 部 会 同 国家 自然 科学 基金 委员 会 
启动 “人 工 智能 驱动 的 科学 人 研究” (AI for Science ) 
专项 部 署 。 本 文通 过 概述 AI4S 发 展现 状 、 分 析 典 
型 AI 应 用 范例 ， 进 一 步 探 讨 AI4S 范式 创新 之 路 。 


1 Al4S 发 展现 状 简 述 

近 几 年 来 ， 在 深度 学 习 等 AI 技术 的 推动 下 ， 
AI48 在 数学 、 物 理学 、 生 物 医学 、 材 料 科 学 等 领域 取 
得 了 许多 令 人 瞩目 的 成 绩 。 

(1) 数学 领域 。2017 年 以 来 ,科学 家 尝试 使 用 
机 器 学 习 、ResNet、seq2seq 模型 等 技术 求解 偏 微分 
方程 ， 获 得 了 更 快 更 准 的 结果 。2021 年 ，DeepMind 
开发 了 启发 数学 家 直觉 灵感 的 机 器 学 习 框 架 ， 帮 助 
数学 家 和 AI 研究 人 员 在 Knots 理论 方面 发 现 新 定理 ， 
证 明了 已 提出 40 年 之 久 的 Kazhdan-Lusztig 多 项 式 。 
2022 年 10 月， 同样 是 DeepMind 在 Nature 发 文 ， 推 出 
在 AlphaZero (前 身 是 著名 的 AlphaGo ) 基础 上 开发 的 
AlphaTensor， 并 通过 强化 学 习 找到 了 和 矩阵 相 乘 的 最 快 
算法 。DeepMind 的 系列 工作 ， 为 AI 驱动 的 数学 研究 
( AI for Math ) 提供 了 可 供 参 考 的 新 范式 。 

(2) 物理 领域 。AI 方 法 除了 用 于 实验 数据 处 理 
和 分 析 之 外 ， 还 帮助 科学 家 设计 实验 、 优 化 参数 。 
20 地 纪 90 年 代 ， 高 能 与 核 物理 学 界 就 使 用 神经 网 络 
和 符号 AI 辅助 研究 。2014 年 ， 人 工 神 经 网 络 赢得 
了 ATILAS 实验 中 识别 硕 格 斯 玻 色 子 的 挑战 。2015 年 ， 
欧洲 核子 研究 组 织 CERN 成 立 了 机 器 学 习 工 作 组 来 
处 理 大 型 强 子 对 撞 机 (LHC ) 产生 的 海量 数据 。 
2022 年 2 月 ，DeepMind 在 Nature 上 发 表 了 其 工作 : 
通过 深度 强化 学 习 对 托 卡 马 克 等 离子 体 进行 磁 控 。 
2022 年 8 月， 物理 学 家 使 用 人 工 神经 网 络 找到 了 质子 
中 存在 隐 性 内 含 紧 夸克 (intrinsic charm quarks ) 的 证 
据 ， 这 一 发 现 可 能 会 改写 量子 色 动 力学 的 教科 书 。 

(3) 生物 医学 领域 。AlphaFold 是 AI4S 领域 最 成 
功 的 代表 。 从 2016 年 开始 ，DeepMind 构建 AI 系统 来 
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挑战 蛋白 质 三 维 结构 预测 任务 。AlphaFold 将 预测 误差 
缩小 到 原子 尺度 ， 而 计算 时 间 从 数 年 缩减 到 数 分 钟 ， 
显著 提升 了 效率 。DeepMind 宣布 其 2 亿 个 蛋白 质 结构 
预测 向 世界 各 地 的 科学 家 提供 开放 访问 ， 这 对 加 速 药 
物 研 究 具 有 重大 意义 。 除 AlphaFold 外 ， 华 盛 顿 大 学 开 
发 的 RoseTTAFold、 中 国 科 学 技术 大 学 研发 的 SCUBA 
等 模型 ， 也 在 该 领域 不 断 突破 。 

(4) 材料 科学 领域 。2011 年 ， 美国 提出 “材料 
基因 组 计划 ” (MGI ) ， 引 在 解码 材料 的 不 同 组 成 成 
分 和 性 能 的 对 应 关系 ,借助 高 通 量 计算 、 大 数据 、 
AI 等 技术 ， 有 效 缩短 了 材料 研发 周期 、 降 低 了 研发 成 
本 。2016 年 Nature 发 布 了 美国 哈弗 福 德 学 院 和 普 渡 大 
学 的 研究 成 果 ， 科研 人 员 利用 机 带 学 习 算法 ， 用 “ 失 
败 ” 的 实验 数据 预测 了 新 材料 合成 ， 这 启示 机 器 学 习 
等 AI 技术 成 为 材料 科学 的 重要 研究 方式 。 

正如 我 们 所 见 ，AI 在 科学 研究 中 的 角色 随 着 深度 
学 习 的 繁荣 而 发 生 了 变化 。 早 期 ，AI 方 法 只 是 作为 辅 
助 工 具 ， 帮 助 分 析 实验 数据 。 如 今 ，AI 方 法 已 成 为 更 
复杂 任务 ( 如 定理 证 明 、 结 构 设 计 和 知识 发 现 ) 实现 
过 程 中 的 关键 技术 。AI 还 在 不 断 拓展 学 科 领 域 ，“ 人 
工 智能 驱动 的 科学 研究 ”专项 部 署 重点 面向 数学 、 物 
理学 、 化 学 、 天 文学 等 基础 学 科 ， 必 将 为 这 些 学 科 快 
速 发 展 带 来 新 契机 。 


2 热点 背后 的 Al 范式 分 析 


在 算法 、 数 据 、 算 力 三 大 引擎 的 驱动 下 ， 深 度 学 
习 时 代 下 的 AI 研究 进展 迅速 ，AlphaGo 、AlphaFold、 
ChatGPT 等 成 为 AI 发展 历史 上 一 座 座 里 程 碑 。 分 析 这 
些 案例 特点 ， 总 结 成 功 经 验 ， 对 于 AI 后 续 的 创新 和 应 
用 具有 十 分 重要 的 启发 意义 。 
2.1 AlphaFold 研究 范式 

DeepMind 推出 的 AlphaFold 系列 是 AI4S 的 最 成 功 
的 代表 之 一 ， 尤 其 是 第 二 代 AlphaFold2 在 2020 年 全 球 
蛋白 质 结构 预测 比赛 ( CASP14 ) 中 拔 得 头筹 ， 蛋 白质 
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三 维 结构 预测 准确 性 接近 实验 结果 。AlphaFold2 的 目 
标 是 根据 输入 的 一 维 氨 基 酸 序列 预测 蛋白 质 的 三 维 结 
构 ， 其 成 功 可 以 归 因 于 领域 知识 与 深度 学 习 前 沿 技术 
的 融合 。 

从 深度 学 习 的 角度 来 看 ，AphaFold2 有 3 个 亮点 。 
(D AlphaFold 2 淘汰 了 第 一 代 所 采用 的 卷 积 神经 网 络 
(CNN ) 特征 提取 结构 ， 替 换 为 基于 注意 力 机 制 的 性 
能 更 强 的 Evoformer。@@) AlphaFold2 不 是 简单 的 单 向 处 
理 流程 ， 而 是 采用 了 循环 迭代 优化 。(3) AlphaFold 2 同 
时 使 用 带 标签 和 未 带 标签 的 数据 进行 网 络 训练 ， 并 融 
入 含 品 自 藻 饮 处理。 整体 来 看 ，AlphaFold2 是 一 个 包 
含 多 种 算法 和 学 习 策 略 的 系统 化 方法 。 

从 知识 融合 的 角度 来 看 ， 相 对 于 神经 网 络 模型 层 
面 的 创新 ， 多 元 知识 的 表示 和 融合 在 AphaFold 2 中 扮 
演 着 更 为 关键 的 角色 。 中 蛋白 质 结构 预测 是 一 个 专业 
方向 ， 科 学 家 通过 数 十 年 的 研究 积累 了 宝贵 的 知识 和 
数据 。ApphaFold 2 使 用 了 2 种 类 型 的 数据 集 : 一 种 是 
序列 数据 集 ， 如 UniRef90、BFD 、MGnify 等 。 基 于 
“同一 位 置 的 氮 基 酸 在 物种 间 是 不 变 的 ，2 个 不 同位 
置 的 氨基 酸 同步 变化 ”这 一 领域 知识 ，AlphaFold 2 从 
遗传 序列 数据 库 中 搜索 并 构建 多 序列 比 对 (MSAs ) ， 
而 MSA 的 质量 决定 了 ApphaFold 2 的 预测 准确 
性 ; 男 一 种 是 结构 数据 集 ， 如 PDB 和 PDB70 等 。 
ApphaFold 2 从 这 些 结构 数据 集中 搜索 并 构建 残 基 之 间 
关系 的 配对 (pair ) 表示 。 通 过 这 种 方式 ， 一 维 氨基 
酸 序列 通过 领域 知识 和 数据 集 进 行 扩充 ， 形 成 2 个 二 
维 关 系 表示 。@) Evoformer 接收 MSA 和 了 Pair 表 示 ,， 在 
行 、 列 2 个 维度 进行 注意 力 计算 ， 完 成 2 种 表示 的 交 
又 融合 。 需 要 注意 的 是 ,在 配对 (pair ) 表示 的 注意 力 
计算 中 引入 了 几何 知识 ， 即 氨基 酸 之 间 的 距离 要 满足 
三 角 不 等 式 约 束 。@) 在 结构 预测 模块 中 ， 利 用 三 维 空 
间 结 构 平 移 和 旋转 等 变 的 知识 ，ApphaFold2 引 入 了 不 
动 点 注意 力 ( IPA ) 计算 。 根 据 IPA 输出 的 残 基 相 对 位 
移 和 旋转 ，AlphaFold 2 进一步 预测 原子 的 空间 位 置 。 
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由 引入 OpenMM 中 的 Amber 力 场 优化 工具 ， 以 确保 输 
出 的 三 维 结构 满足 立体 化 学 约束 。 

从 对 AphaFold 2 研究 范式 的 分 析 可 以 看 出 ， 其 特 
点 是 深度 学 习 技 术 与 各 类 知识 的 有 机 融合 ， 涵 盖 了 知 
识 、 数 据 、 算 法 、 算 力 这 4 种 第 三 代 AI 的 核心 要 素 。 
因此 ， 围 绕 深 度 学 习 ， 研 究 知识 获取 、 知 识 表 示 、 知 
识 集 成 、 知 识 利 用 ， 即 知识 自动 化 方法 ， 探 索 “ 知 识 - 
学 习 ” 协 同 组 织 形式 ， 开 发 协助 AI4S 研究 的 系统 化 基 
础 框架 ， 应 当 得 到 AI 界 和 科学 界 的 共同 重视 和 大 力 投 
入 。 

2.2 ChatGPT 研发 范式 

自 2022 年 11 月 起 ，ChatGPT 掀起 新 一 轮 AI 全 球 
浪潮 。ChatGPT 因 其 能 够 进行 多 轮 对话 、 承 认错 误 、 
反驳 错误 前 提 和 拒绝 回答 不 恰当 的 问题 而 享有 盛誉 。 
ChatGPT 在 回答 问题 的 准确 性 和 逻辑 完整 性 方面 超越 
了 现 有 的 聊天 机 器 人 ， 在 遵守 道德 、 伦 理 、 法 律 方面 
也 有 很 好 的 表现 。ChatGPT 是 OpenAI 近 年 来 研发 的 一 
系列 GPT 模 型 在 对 话 场 景 的 实例 ， 有 3 个 技术 特征 。 

(1) ChatGPT 基于 大 规模 预 训 练 语言 模型 ， 即 
名 的 GPT-3 系列 (GPT-3.5) 。 在 过 去 的 几 年 里 ， 大 大 
模 的 预 训练 模型 发 展 迅 速 。 大 规模 预 训练 模型 通过 和 
习 大 量 的 公开 数据 ， 将 学 习 到 的 知识 存储 在 大 规模 考 
数 之 中 ， 不 断 刷 新 多 个 领域 中 多 数 任务 的 最 高 | 
录 ， 是 通 向 通用 人 工 智 能 的 可 行路 径 。 

(2) ChatGPT 使 用 人 类 反馈 强化 学 习 (RLHF) 
在 GPT-3.5 上 进行 微调 。 微 调 是 包含 2 个 数据 集 的 过 
程 ， 共 有 3 步 : 第 一 步 ， 由 2 个 AI 训练 师 基于 给 定 
采样 提示 (prompt ) 通过 对 话 生 成 人 类 演示 数据 集 ， 
用 于 GPT-3.5 微调 训练 ， 结 果 称 为 有 监督 微调 模型 
(SFT ) 。 第 二 步 ， 通 过 AI 培训 师 和 聊天 机 器 人 之 间 
的 对 话 收集 比较 数据 集 ， 对 SFT 模型 输出 的 多 个 结 
果 ,， 由 AI 培训 师 给 出 从 最 好 到 最 差 的 打分 排序 。 之 
后 ， 用 这 个 排序 数据 集训 练 强化 学 习 的 奖励 模型 ， 此 
过 程 也 是 有 监督 的 方式 。 第 三 步 ， 使 用 近 端 策略 优化 
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(PPO ) 算法 ， 由 奖励 模型 生成 reward， 通 过 强化 学 
习 进 一 步 微调 SFT 模型。 第 二 步 和 第 三 步 重复 多 次 ， 
最 后 得 到 PPO 模型 ， 即 ChatGPT。 

(3) GPT 模型 按照 “开发 -部 署 ” 的 理念 迭代 完 
善 。 将 初步 开发 完成 的 模型 部 署 上 线 ， 为 用 户 提供 测 
试 服务 ， 由 此 收集 用 户 与 模型 的 交互 数据 作为 进一步 
优化 模型 的 基础 。 开 发 (学习 ) 和 部 署 (应 用 ) 形成 
闭环 ， 这 种 迭代 优化 策略 在 降低 语言 模型 误 用 风险 方 
面 起 着 至 关 重 要 的 作用 。 

ChatGPT 范式 再 次 展示 了 预 训练 大 型 模型 的 强大 
功能 ,凸显 了 人 类 在 引导 大 模型 遵循 人 类 规则 方面 的 
重要 作用 。 由 此 可 见 ， 针 对 大 模型 的 微调 、 上 下 文学 
习 、 指 示 学 习 、 提 示 学 习 是 AI 的 重要 研究 方向 。 


3 探索 Al4S 研究 新 范式 


AI 本 身 的 研究 范式 也 在 不 断 转变 。 自 AI 诞生 之 
初 ， 人 们 基于 几 个 基本 假设 ( 如 独立 同 分 布 、Markov 
属性 等 ) ， 使 用 初级 方法 (如 Perceptron 等 ) 解决 简单 
的 问题 (如 简单 的 二 元 分 类 、 回 归 等 ) ， 并 由 此 产生 
了 3 种 基本 范式 一 一 监督 学 习 、 无 监督 学 习 和 强化 学 
习 。 但 面 对 复 杂 问 题 时 ， 这 些 基本 范式 存在 局 限 性 。 
因此 ， 随 着 新 的 算法 ( BP 算法 、 分 层 训 练 等 ) 和 模 
型 ( CNN、 长 短期 记忆 人 工 神经 网 络 LSTM 等 ) 的 出 


受热 力学 启发 的 扩散 模型 ( Diffusion Model ) ， 在 Ai 
生成 内 容 ( AIGC ) 领域 显示 出 巨大 潜力 。 由 此 可 以 看 
出 ，Science for AI 对 AI 算法 创新 也 具有 重要 意义 ， 应 
得 到 同 AI4S 一 样 的 重视 。 
3.2 模型 

机 器 学 习 模 型 的 创新 是 推动 人 工 智 能 发 
展 的 核心 有 要素。 尤其 是 神经 网 络 新 架构 : 
从 M-P 模型 到 Perceptron， 从 LeNet 到 ResNet， 


从 LSTM 到 Transformer。AlphaGo 以 CNN 为 主干 网 
络 ， 用 于 提取 棋局 特征 、 辅 助 走 棋 决 策 和 棋局 评估 。 
AlphaFold 2 用 Transformer ( EvoFormer ) 替换 CNN 模 
型 ， 这 是 其 性 能 相 比 第 一 代 有 巨大 提升 的 主要 原因 之 
一 。ChatGPT 建立 在 基础 模型 (GPT-3 ) 之 上 ， 充 分 利 
用 了 大 规模 预 训练 语言 模型 的 力量 。 利 用 大 模型 的 规 
模 效 应 ， 研 究 利 用 prompt 等 方法 引导 大 模型 释放 内 在 
能 力 ， 是 AI4S 重要 方向 之 一 。 
3.3 数据 

数据 是 深度 学 习 的 三 大 核心 驱动 力 之 一 ， 但 存在 
标签 数量 少 、 标 注 成 本 高 、 分 布 不 平衡 、 隐 私 保护 等 
问题 。 主 动 学 习 、 漳 因 学 习 、 对 比 学 习 、 平 行 学 习 和 
迁移 学 习 等 学 习 范 式 ， 能 够 在 一 定 程度 上 克服 数据 标 
注 的 不 足 ; 而 多 任务 学 习 、 迁 移 学 习 、 元 学 习 和 终身 
学 习 ， 在 一 定 程度 上 能 克服 不 同 任务 之 间 存 在 数据 


现 ，AI 逐渐 发 展 出 主动 学 习 、 迁 移 学 习 、 终 身 学 习 等 
新 范式 。 近 年 来 ，AlphaGo 和 ChatGPT 等 前 沿 进展 以 
其 革命 性 的 成 就 引领 了 新 一 轮 的 范式 转变 。 从 范式 转 
变 的 角度 看 待人 工 智能 的 发 展 ， 对 促进 探索 AI48 创 
新 应 用 具有 重要 价值 ， 为 此 ， 以 下 从 算法 、 模 型 、 数 
据 、 知 识 、 人 的 角色 等 方面 进行 分 析 。 
3.1 算法 

算法 是 人 工 物 能 的 基石 。 典 型 AI 新 范式 中 使 用 的 
算法 不 仅 限 于 机 器 学 习 ， 还 涉及 整个 人 工 智 能 领域 ， 
包括 搜索 和 推理 。 例 如 ，AlphaGo 的 主干 是 蒙特 卡 洛 
树 搜 索 (MCTS ) 算法 。 近 年 来 出 现 的 新 算法 ， 例 如 


不 平衡 问题 ;联邦 学 习 可 用 来 解决 数据 安全 和 隐私 问 


题 。 


新 范式 在 数据 的 使 用 方面 有 更 多 亮点 ，Syn2Real 
和 Sim2Real 等 数据 生成 方法 得 到 越 来 越 多 的 重视 。 例 
如 ，AlphaGo 首先 在 人 类 棋局 上 训练 策略 ， 通 过 自我 
对 弈 产生 更 多 的 数据 来 训练 更 强大 的 策略 网 络 ， 进 而 
产生 更 多 的 数据 来 训练 强大 的 价值 网 络 。AlphaFold 充 
分 利用 遗传 数据 和 结构 数据 ， 还 通过 自 蒸 馏 的 方式 使 
用 未 标注 数据 来 弥补 标注 数据 的 不 足 。ChatGPT 使 用 
人 类 的 演示 数据 来 微调 GPT-3.5， 并 通过 prompt 在 聊 
天 机 器 人 和 AI 训 练 师 之 间 生 成 更 多 的 数据 ， 进 一 步 训 
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练 奖励 模型 将 数据 生成 过 程 自动 化 。 这 些 范 式 具 有 一 
个 共同 特征 ， 即 它们 在 缺乏 标记 数据 时 尝试 生成 数据 
以 提高 性 能 。 
3.4 知识 

AI 基本 范式 很 少 显 式 引 入 知识 ， 但 在 模型 设计 
(如 CNN ) 时 引入 的 偏差 (bias ) 也 可 以 看 作 是 先 验 
知识 。 中 级 范式 通常 有 3 种 引入 知识 的 方式 : 四 直接 
( 如 主动 学 习 ) 或 间接 ( 如 课程 学 习 ) 通过 学 习 策 略 
的 设计 来 提高 学 习性 能 ; @ 使 用 从 先前 任务 或 其 他 
任务 (数据 ) 中 学 到 的 知识 来 帮助 新 的 学 习 任 务 。 例 
如 ， 多 任务 学 习 、 迁 移 学 习 、 元 学 习 、 平 行 学 习 等 ; 
@ 整合 上 述 2 种 方法 ， 设 计 并 维护 一 个 专门 的 知识 库 
来 辅助 学 习 过 程 。 例 如 ， 终 身 学 习 和 漳 因 学 习 等 。 

目前 ， 大 多 数 机 器 学 习 范 式 都 采用 知识 的 和 谍 入 表 
示 ， 以 便 将 知识 融合 到 学 习 过 程 中 ; 但 其 中 有 2 个 例 
外 ， 即 终身 学 习 和 归纳 学 习 ， 它 们 具有 独立 的 知识 
库 。 我 们 还 发 现 反馈 对 于 学 习 中 的 知识 获取 、 整 合 和 
自动 化 至 关 重 要 。 高 级 范式 高 度 依赖 知识 ， 例 如 ， 
AlphaGo 首先 利用 人 类 棋 手 的 经 验 (可 看 作 一 种 知识 ) 
训练 策略 网 络 ， 然 后 利用 围棋 规则 ( 也 是 一 种 知识 ) 通 
过 强化 学 习 改 进 策 略 ， 进 一 步 通过 自我 对 弈 生成 大 量 
棋局 。AlphaFold 整合 了 生物 学 家 的 发 现 ， 以 及 来 自 遗 
传 学 、 数 学 和 化 学 领域 的 知识 ， 这 种 高 级 范式 是 知识 
密集 型 的 代表 ， 为 AI4S 的 进一步 研究 提供 重要 参考 。 
ChatGPT 的 基础 是 大 规模 预 训练 语言 模型 ( GPT3 ) ， 
可 以 看 作 是 从 海量 数据 中 提炼 出 来 的 隐 性 知识 库 ， 而 提 
示 工 程 ( prompt engineering ) 是 引导 大 模型 生成 内 容 并 
对 齐 到 人 类 会 话 风 格 、 伦 理 和 规范 的 过 程 。 
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运用 知识 的 能 力 很 大 程度 上 决定 了 学 习 能 力 。 然 
而 ， 将 知识 整合 到 机 器 学 习 的 过 程 中 具有 很 大 挑战 ， 
知识 的 获取 、 表 示 、 集 成 、 利 用 等 环节 通常 需要 人 类 
的 参与 。“ 人 工 智能 驱动 的 科学 人 研究 ”专项 部 署 强调 
围绕 药物 研发 、 基 因 人 研究、 生物 育种 、 新 材料 研发 等 
需求 ， 而 知识 融入 这 些 专 业 性 强 的 AI4S 领域 中 尤为 突 
出 。 为 此 ， 将 大 模型 打造 为 知识 工厂 ， 研 究 服务 于 科 
学 家 的 知识 自动 化 方法 ， 将 是 推动 高 效 AI4S 的 重要 保 
障 。 

3.5 人 的 因素 

在 深度 学 习 之 前 ， 依 赖 于 人 类 的 特征 工程 在 AI 研 
究 中 起 着 决定 性 的 作用 。 特 征 工程 既 费 时 又 低 效 ， 
而 深度 学 习 解决 了 这 个 问题 。 深 度 神经 网 络 能 够 自 
动 、 准 确 、 高 效 地 提取 特征 ， 由 此 ， 端 到 端 学 习 模 型 
越 来 越 受 欢迎 。 然 而 ， 在 某 些 应 用 中 ， 人 扮演 着 重要 
的 角色 ， 如 提出 要 求 、 设 定 目标 、 提 供 知 识 、 实 施 控 
制 、 执 行 评 估 等 。 因 此， 端 到 端 学 习 不 是 最 终 目 标 ， 
不 能 简单 地 将 人 类 从 机 器 学 习 过 程 中 移 除 。 人 类 在 环 
( human-in-loop ) 模式 的 价值 在 ChatGPT 的 成 功 中 显 
而 易 见 ， 其 中 来 自 人 类 反馈 的 强化 学 习 ( RLHF ) 发 挥 
了 关键 作用 。 

除 以 上 因素 之 外 ， 开 展 AI4S 研究 的 组 织 方式 也 是 
不 可 回避 的 重要 问题 。 当 前 ， 国 际 上 多 种 针对 产品 开 
发 的 DAO (分 布 式 开放 自主 组 织 ) 和 针对 基础 研究 
的 DeSci (分 布 式 开放 科学 运动 ) 正 蓬勃 兴起 ， 特 色 就 
是 利用 智能 科学 与 技术 (IST ) ， 基 于 区 块 链 和 智能 合 
约 的 数字 组 织 和 数字 治理 。ChatGPT 的 诞生 本 质 上 也 
是 得 益 于 这 种 模式 ，DeSci 和 DAO 也 值得 我 们 关注 。 
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